首页> 外文OA文献 >Simple Reinforcement Learning Agents: Pareto Beats Nash in an Algorithmic Game Theory Study
【2h】

Simple Reinforcement Learning Agents: Pareto Beats Nash in an Algorithmic Game Theory Study

机译:简单的强化学习代理:帕累托在算法博弈论研究中击败纳什

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Repeated play in games by simple adaptive agents is investigated. The agents use Q-learning, a special form of reinforcement learning, to direct learning of behavioral strategies in a number of 2×2 games. The agents are able effectively to maximize the total wealth extracted. This often leads to Pareto optimal outcomes. When the rewards signals are sufficiently clear, Pareto optimal outcomes will largely be achieved. The effect can select Pareto outcomes that are not Nash equilibria and it can select Pareto optimal outcomes among Nash equilibria.
机译:研究了简单的自适应代理在游戏中的重复玩法。代理商使用Q学习(一种强化学习的特殊形式)来指导2×2游戏中行为策略的学习。代理商能够有效地使提取的总财富最大化。这通常会导致帕累托最优结果。当奖励信号足够清晰时,帕累托最优结果将在很大程度上实现。该效应可以选择非纳什均衡的帕累托结果,并且可以在纳什均衡中选择帕累托最优结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号